transformer

深度解析:Transformer中的残差网络与前馈网络如何协同工作

在深度学习领域,模型训练过程中的性能优化一直是一个备受关注的话题。特别是在处理复杂任务如自然语言理解时,模型的每一层网络都会增加计算负担,可能导致梯度下降过程中的不稳定现象。梯度在下降过程中,有时会跳过最优解,或在最优解附近徘徊,这不仅消耗了大量计算资源,还可

transformer 残差 前馈 前馈网络 残差网络 2025-06-26 21:54  13

Transformer 在具身智能“水土不服”,大模型强≠机器人强 | 万有引力

自年初以来,一系列现象级事件不断将具身智能推向公众视野:从春晚开始,宇树机器人频频登上热搜,逐渐风靡全国并走向世界;一众技术“大佬”纷纷投身机器人创业,大批创业项目集中涌现,几乎所有人都在下注——通用机器人的时代,仿佛触手可及。

模型 智能 机器人 transformer 万有引力 2025-06-18 18:54  8

独家|魔术背后:张量如何驱动变换器(Transformer)

变换器改变了人工智能在语言理解和数据学习等方面的工作方式,大语言模型的核心是张量(一种帮助处理信息的通用数学矩阵)。当数据通过变换器的不同部分时,张量会发生不同的变换,从而帮助模型理解句子或图像等内容。了解变换器中的张量是如何工作的,有助于理解当今最智能的人工

魔术 张量 transformer 解码器 变换器 2025-06-10 07:08  8

AI时代的绝命高考(续)

2023年,ChatGPT大爆发之后,一年一度的高考季就来临了。从知识体系的传播角度看,两个事情的诡异同框,让“小镇做题家”的人生令人怀疑。于是,写了《AI时代的绝命高考》「链接」。由于文章过于真实,命被“头条”绝了,但“知乎”良知尚存,让它活了下来。

高考 chatgpt transformer 创造力 cla 2025-06-09 00:17  10